1. Identity statement | |
Reference Type | Conference Paper (Conference Proceedings) |
Site | mtc-m16d.sid.inpe.br |
Holder Code | isadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S |
Identifier | 8JMKD3MGPDW34R/3U5US6S |
Repository | sid.inpe.br/mtc-m16d/2019/09.30.13.43 |
Last Update | 2019:09.30.13.43.41 (UTC) simone |
Metadata Repository | sid.inpe.br/mtc-m16d/2019/09.30.13.43.41 |
Metadata Last Update | 2022:07.08.20.08.57 (UTC) administrator |
Citation Key | RosaSant:2019:EsApDa |
Title | Estudos aplicados à data science com foco em dados públicos |
Format | On-line |
Year | 2019 |
Access Date | 2024, May 19 |
Secondary Type | PRE CN |
Number of Files | 1 |
Size | 63 KiB |
|
2. Context | |
Author | 1 Rosa, Letícia da Silva 2 Santos, Rafael Duarte Coelho dos |
Resume Identifier | 1 2 8JMKD3MGP5W/3C9JJ4N |
Group | 1 2 LABAC-COCTE-INPE-MCTIC-GOV-BR |
Affiliation | 1 Universidade Paulista (UNIP) 2 Instituto Nacional de Pesquisas Espaciais (INPE) |
Author e-Mail Address | 1 leticiadasilva.contato@gmail.com 2 rafael.santos@.inpe.br |
Editor | Santos, Rafael Duarte Coelho Dos Mattos, Ariane Frassoni Dos Santos De Mello, Carina Barros Queiroz, Gilberto Ribeiro De Vasconcelos, Leandro Guarino De Vieira, Luis Eduardo Antunes Forti, Maria Cristina Gatto, Rubens Cruz |
Conference Name | Seminário de Iniciação Científica e Iniciação em Desenvolvimento Tecnológico e Inovação (SICINPE) |
Conference Location | São José dos Campos |
Date | 12-13 ago. 2019 |
Publisher | Instituto Nacional de Pesquisas Espaciais (INPE) |
Publisher City | São José dos Campos |
Book Title | Anais |
Organization | Instituto Nacional de Pesquisas Espaciais (INPE) |
History (UTC) | 2019-09-30 13:44:34 :: simone -> administrator :: 2019 2020-01-06 12:48:42 :: administrator -> simone :: 2019 2020-05-07 19:18:12 :: simone -> administrator :: 2019 2022-07-08 20:08:57 :: administrator -> simone :: 2019 |
|
3. Content and structure | |
Is the master or a copy? | is the master |
Content Stage | completed |
Transferable | 1 |
Keywords | data science |
Abstract | Este trabalho, iniciado em agosto de 2018, tem como objetivo o aprendizado e aprofundamento em técnicas utilizadas na área de Ciência de Dados, para sua aplicação em projetos que possuam a necessidade de obter informações contidas em espaços não tão claros para sua captura. Dona de um crescimento notório nos últimos anos, a área de Data Science vem ganhando espaço devido a grande quantidade de dados existentes, dos quais podem ser extraídas informações para diversas frentes. Uma delas é a dos Dados Públicos, que ganhou visibilidade a partir da Lei de Acesso à Informação, em vigor desde 2012. Ela regulamenta que informações públicas dos órgãos e entidades do governo, em todas suas esferas, sejam recebidas por pessoas físicas ou jurídicas. Com base nos fatos apontados, um projeto foi desenvolvido utilizando a plataforma do DATASUS, onde dados de mortalidade dos desastres climáticos mais importantes do Brasil foram extraídos e analisados. O trabalho mostra as dificuldades enfrentadas desde a obtenção até a manipulação dos dados, de que maneira que eles foram disponibilizados, qual foi o impacto gerado no produto e o que pode ser extraído dessa experiência. O projeto conta com a participação de um trabalho de doutorado que deu origem a temática dos dados extraídos, da doutoranda Gabriela Couto, cujo foco é analisar os dez maiores desastres climáticos ocorridos na história brasileira através das lentes do gênero. Isso possibilitou o desenvolvimento de um olhar mais apurado para as situações evidenciadas e os respectivos resultados apresentados. Ferramentas como as linguagens Python, R e SQL, notebooks, e conceitos de Web Scraping e Data Mining foram utilizadas para o estudo. Devido às variadas formas que o dado foi encontrado, é possível notar os desafios apresentados para os profissional da área, que não é capaz de prever qual será o cenário encontrado para a extração das informações necessárias. Espera-se dar continuidade ao projeto de forma a proporcionar maior embasamento na área, possibilitando que novas vertentes venham a ser trabalhadas e que processos de análise, automatização e extração dos dados sejam implantados e melhorados. |
Area | COMP |
Type | COMP |
Arrangement 1 | urlib.net > BDMCI > Fonds > Produção anterior à 2021 > LABAC > Estudos aplicados à... |
Arrangement 2 | urlib.net > BDMCI > Fonds > Acervo PIBIC/PIBITI > PIBIC/PIBITI 2019 > Estudos aplicados à... |
doc Directory Content | access |
source Directory Content | there are no files |
agreement Directory Content | there are no files |
|
4. Conditions of access and use | |
data URL | http://urlib.net/ibi/8JMKD3MGPDW34R/3U5US6S |
zipped data URL | http://urlib.net/zip/8JMKD3MGPDW34R/3U5US6S |
Language | pt |
Target File | 2019 LETICIA SILVA.pdf |
User Group | self-uploading-INPE-MCTI-GOV-BR simone |
Reader Group | administrator rafael.santos@inpe.br self-uploading-INPE-MCTI-GOV-BR simone |
Visibility | shown |
Copyright License | urlib.net/www/2012/11.12.15.19 |
Rightsholder | originalauthor yes |
Update Permission | not transferred |
|
5. Allied materials | |
Linking | Trabalho não Vinculado à Tese/Dissertação |
Next Higher Units | 8JMKD3MGPCW/3ESGTTP 8JMKD3MGPDW34P/478H8JH |
Citing Item List | sid.inpe.br/mtc-m16c/2022/07.08.19.43.45 5 sid.inpe.br/mtc-m21/2012/07.13.14.58.32 1 |
Host Collection | sid.inpe.br/mtc-m19@80/2009/08.21.17.02 |
|
6. Notes | |
Notes | Bolsa PIBIC/INPE/CNPq |
Empty Fields | archivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel dissemination doi e-mailaddress edition isbn issn label lineage mark mirrorrepository nextedition numberofvolumes orcid pages parameterlist parentrepositories previousedition previouslowerunit progress project readpermission schedulinginformation secondarydate secondarykey secondarymark serieseditor session shorttitle sponsor subject tertiarytype url versiontype volume |
|
7. Description control | |
e-Mail (login) | simone |
update | |
|